Loading...
机构名称:
¥ 1.0

体现的智能集成了多种模态,使代理可以同时理解图像,语言和动作。但是,现有模型始终取决于其他数据集或广泛的预培训,以最大程度地提高性能,消耗丰富的培训时间和昂贵的硬件成本。为了解决这个问题,我们介绍了Robobert,这是一种与独特的培训策略相结合的新型端到端机器人操纵模型。该模型利用基于CNN的扩散策略,通过将训练过程分开不同方式来增强和稳定该模型的有效性。它还强调了数据增强的重要性,从而验证了各种技术以显着提高性能。与依赖额外数据或大型基础模型的模型不同,Robobert在仅使用语言标记的专家演示并保持相对较小的模型大小的同时,取得了竞争激烈的成功率。具体来说,Robobert在Calvin基准测试ABCD→D任务上的平均长度为4.52,设置了新的最先进(SOTA)记录。此外,在对真实机器人进行测试时,该模型表现出卓越的性能,比其他使用相同数据训练的方法获得了更高的成功率。我们建议,这些Robobert的这些概念和方法表现出广泛的多功能性和兼容性,这极大地有助于轻巧的多峰机器人模型的发展。可以在https://github.com/peterwangsicheng/robobert 1

arxiv:2502.07837v1 [cs.ro] 2025年2月11日

arxiv:2502.07837v1 [cs.ro] 2025年2月11日PDF文件第1页

arxiv:2502.07837v1 [cs.ro] 2025年2月11日PDF文件第2页

arxiv:2502.07837v1 [cs.ro] 2025年2月11日PDF文件第3页

arxiv:2502.07837v1 [cs.ro] 2025年2月11日PDF文件第4页

arxiv:2502.07837v1 [cs.ro] 2025年2月11日PDF文件第5页

相关文件推荐

2025 年
¥1.0